WGS分析笔记(0)- 我的数据

  • 我研究的课题主要是通过二代重测序获得基因组数据进而进行疾病分析

概述

  • 二代测序技术(next generation sequencing,NGS),又称为高通量测序技术(high-throughput sequencing,HTS)或深度测序(deep sequencing),通过一次对几十万到几百万条核酸分子进行序列测定,进而对一个物种的转录组和基因组进行细致全貌的分析
  • 一般我们对人类基因组的研究策略主要是三个:
    • 全基因组重测序(whole genome re-sequencing,WGS)
    • 全外显子组重测序(whole exome re-sequencing,WES)
    • 目标区域测序(target region re-sequencing,TR)
  • 对于这三个策略如何应用,这完全看课题需要,没有人说过这三个策略必须分开进行,实际上目前很多课题组在进行研究的时候,都会先分析WES和panel的数据,再考虑进行WGS的测序分析,也有些课题组通过panel筛选病例,再进行WES或WGS的分析。以上只是两个简单的思路,适用于不同的课题需求。那到底怎么去选取研究策略,还是根据课题的需求,这充分说明了,课题设计的重要性,从我踩过的坑来看,一个好的课题设计,能让你后续的分析少碰很多壁,而且我觉得课题是循序渐进的,具体怎么去做要根据预实验好好的验证
  • WGS和WES怎么选择呢,也是看研究疾病的情况,比较而言,WES的成本会低,而目前报道来看80%的疾病都是由于exon区域的突变贡献的,WGS的成本相对较高,深度也不及WES,类似嵌合体什么的,靠WGS是检测不出来的,但是WGS的覆盖广,noncoding区域一直是有待研究的区域,WGS也有利于SV的检测,目前大多数类似文章的研究还是WES为主,但是主流的声响一直在推广WGS
  • 而我的课题就是属于没有被好好设计的那种,那么我的研究对象主要是(全是)WGS的数据了,既然这已经改变不了了,那就好好分析,以找出差异基因,争取早日脱离苦海
  • 那么之后我要分析的内容其实是以WGS的数据为对象,当然,这并没有太大影响,因为很多分析是大同小异的
  • 这里贴一张某测序公司培训时给的WGS数据分析流程,我的样本测序就是交给这家公司来完成的,这张照片比较早,大概是2018年4月时候的培训,不知道这家公司现在还是不是这么分析的,但这并不重要,目前大体的分析流程大同小异,一般发表的文章也会提供分析方法,也是值得大家借鉴的

分析流程

  • 而我后面的分析方法和流程与这里也是有差别的,但我为什么没有贴我自己的流程图呢,主要是因为我的流程细节部分还在不断的修改过程中,我后面的文章会按照我的流程进行一步步的介绍,也会抛出我遇到的问题,希望能得到大家的指点,大家共同交流,批评指正!!!
-------------本文结束感谢您的阅读-------------

本文标题:WGS分析笔记(0)- 我的数据

文章作者:TongShiyuan

发布时间:2019年06月17日 - 22:06

最后更新:2019年06月18日 - 00:06

原始链接:http://tongshiyuan.github.io/2019/06/17/WGS分析笔记(0)- 我的数据/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。